IT之家 04-26 07:05

英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user

📌 一句话:英伟达服务器已原生支持国产DeepSeek-V4,单用户每秒生成超150词元,AI推理进入"即时响应"时代。

💡 3个要点

  • 英伟达GB200 NVL72服务器已原生适配DeepSeek-V4模型,开箱即用无需额外优化

  • 实测性能超过150 tokens/sec/user,响应速度达到毫秒级交互体验

  • 体现AI基础设施与模型深度协同优化的行业趋势,软硬件整合成核心竞争力

📖 背景

DeepSeek-V4是国产开源大模型,性能对标GPT-4等国际顶级模型,此次获英伟达官方适配意义重大。

💭 点评

性能突破150 tokens/sec意味着AI交互从"等待"变成"对话",这不是简单的数字提升,而是应用场景的彻底打开——实时翻译、即时问答、现场辅助决策都将变为可能。英伟达主动适配国产模型,既是技术认可,也预示着AI竞争进入"落地为王"阶段。

码头码农 - 微信搜索关注